期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于表示学习和深度森林的长链非编码RNA编码短肽预测模型
纪腾其, 孟军, 赵思远, 胡鹤还
《计算机应用》唯一官方网站    2021, 41 (12): 3614-3619.   DOI: 10.11772/j.issn.1001-9081.2021061082
摘要249)   HTML14)    PDF (891KB)(96)    收藏

长链非编码RNA(lncRNA)中的小开放阅读框(sORFs)能够编码长度不超过100个氨基酸的短肽。针对短肽预测研究中lncRNA中的sORFs特征不鲜明且高可信度数据尚不充分的问题,提出一种基于表示学习的深度森林(DF)模型。首先,使用常规lncRNA特征提取方法对sORFs进行编码;其次,通过自编码器(AE)进行表示学习来获得输入数据的高效表示;最后,训练DF模型实现对lncRNA编码短肽的预测。实验结果表明,该模型在拟南芥数据集上能够达到92.08%的准确率,高于传统机器学习模型、深度学习模型以及组合模型,且具有较好的稳定性;此外,在大豆与玉米数据集上进行的模型测试中,该模型的准确率分别能达到78.16%和74.92%,验证了所提模型良好的泛化能力。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于改进相似性度量的项目协同过滤推荐算法
于金明, 孟军, 吴秋峰
计算机应用    2017, 37 (5): 1387-1391.   DOI: 10.11772/j.issn.1001-9081.2017.05.1387
摘要728)      PDF (922KB)(636)    收藏
针对传统协同过滤推荐算法遇到冷启动情况效果不佳的问题,提出一种基于项目相似性度量方法(IPSS)的项目协同过滤推荐算法(ICF_IPSS),其核心是一种新的项目相似性度量方法,该方法由评分相似性和结构相似性两部分构成:评分相似性部分充分考虑两个项目评分之间的评分差、项目评分与评分中值之差,以及项目评分与其他评分平均值之差;结构相似性部分定义了共同评分项目占所有项目比重,并惩罚活跃用户的逆项目频率(ⅡF)系数。在Movie Lens和Jester数据集下测试算法准确率。在Movie Lens数据集下,当近邻数量为10时,ICF_IPSS的平均绝对偏差(MAE)和均方根误差(RMSE)分别比基于Jaccard系数的均方差异系数的项目协同过滤算法(ICF_JMSD)低3.06%和1.20%;当推荐项目数量为10时,ICF_IPSS的准确率和召回率分别比ICF_JMSD提升67.79%和67.86%。实验结果表明,基于IPSS的项目协同过滤算法在预测准确率和分类准确率方面均优于基于传统相似性度量的项目协同过滤算法,如ICF_JMSD等。
参考文献 | 相关文章 | 多维度评价
3. 融合粒子群优化和遗传算法的基因调控网络构建
孟军, 史贯丽
计算机应用    2016, 36 (11): 2969-2973.   DOI: 10.11772/j.issn.1001-9081.2016.11.2969
摘要793)      PDF (752KB)(460)    收藏
MicroRNA(miRNA)是一类大小为21~25 nt的内源性非编码小核糖核酸(RNA),通过与mRNA的3’-UTR互补结合,导致mRNA降解或翻译抑制来调控编码基因的表达。为了提高构建基因调控网络的准确度,提出一种基于粗糙集、融合粒子群(PSO)和遗传算法(GA)的基因调控网络构建方法(PSO-GA-RS)。该方法首先通过对序列信息进行特征提取;然后采用粗糙集的依赖度作为适应度函数,融合粒子群和遗传算法选出较优的特征子集;最后使用支持向量机(SVM)建立模型,预测未知的调控关系。在拟南芥数据集上进行实验,相比基于粗糙集和粒子群优化的特征选择方法和Rosetta算法,所提方法的预测准确率、F值和受试者工作特征(ROC)曲线面积最多能提高5%,在水稻数据集上最多能提高8%。实验结果表明所提方法能够比较准确地预测miRNA和靶基因之间的调控关系。
参考文献 | 相关文章 | 多维度评价
4. 基于双重索引矩阵的蛋白质功能预测
孟军, 张信
计算机应用    2015, 35 (6): 1637-1642.   DOI: 10.11772/j.issn.1001-9081.2015.06.1637
摘要487)      PDF (880KB)(424)    收藏

针对单一数据源预测蛋白质功能效果不佳以及蛋白质相互作用网络信息不完全等问题,提出一种多数据源融合和基于双重索引矩阵的随机游走的蛋白质功能预测(MSI-RWDIM)算法。该算法使用了蛋白质序列、基因表达和蛋白质相互作用数据预测蛋白质功能,并根据这些数据源特性构建相应的相互作用加权网络;然后融合各数据源加权网络并结合功能相关性网络构建双重索引矩阵,使用随机游走算法计算得分进而预测蛋白质功能。在酵母数据集的五折交叉验证中,MSI-RWDIM算法具有较高的准确率和较低的覆盖率,还可降低功能标签损失率。研究结果表明,MSI-RWDIM算法的总体性能优于常用的k-近邻、直推式多标签集成分类和快速同步加权方法。

参考文献 | 相关文章 | 多维度评价
5. 基于有向双关系图和多核融合的蛋白质功能预测
孟军 刁印
计算机应用    2014, 34 (12): 3433-3437.  
摘要148)      PDF (865KB)(626)    收藏

针对多源异构蛋白质相互作用网络信息量大、数据冗余导致预测结果不能充分反映数据分布信息的问题,将功能类别网络和蛋白质相互作用网络相结合,提出基于有向双关系图和多核融合的多标记学习算法。首先,构建基于含有损失函数的目标方程和最大期望算法的自适应模型;然后,利用图优化策略融合功能类别和蛋白质相互作用网络构成的多个关联矩阵;最后,将融合后的关联矩阵代入模型中预测蛋白质功能。在Yeast和Mouse的蛋白质多源异构数据上的实验结果表明,提出的方法具有预测准确率高、标签损失率低等优势。

参考文献 | 相关文章 | 多维度评价
6. 一类支持向量机在烟叶选择中的应用
王强 陈英武 李孟军
计算机应用   
摘要1688)      PDF (740KB)(1010)    收藏
为解决卷烟叶组配方中的烟叶替换问题,提出了基于一类支持向量机的烟叶选择方法。介绍了烟叶选择支持向量机建模的原理,分析了影响模型准确性的主要因素,提出了特征选择与支持向量机参数的联合优化策略。应用实例表明,该方法能够根据烟叶中的化学成分的测量值来确定烟叶的相似性,为实现烟叶的智能化选择打下了基础。
相关文章 | 多维度评价
7. CCML2021+85: 基于表示学习和深度森林的lncRNA编码短肽预测模型
纪腾其 孟军 赵思远 胡鹤还
  
录用日期: 2021-06-13